Contratos Kernel: Acotando la Divergencia entre Entrenamiento e Inferencia Los contratos kernel acotan la divergencia entre entrenamiento e inferencia, reduciendo sesgos en el gradiente de política en post-entrenamiento de RL. 2026-06-09 · 1 min